Domaći III

Linearna i logistička regresija

Student: Božović Jovana (51 / 2024)

Baza podataka

Za potrebe prvog domaćeg koristićemo dio baze podataka koja sadrži informacije o nivou ekonomskog i političkog razvoja. Datoteka dodijeljena svakom studentu sadrži između 100 i 150 redova (država) i 10 kolona (varijabli). Detaljan opis varijabli nalazi se u Tabeli 1:

Tabela 1. Pregled varijabli u bazi podataka

Varijabla Opis Skala
naziv Ime države Nominalna
razvoj Indeks ljudskog razvoja (HDI) Intervalna
rezim Kojeg je tipa politički režim Nominalna
gini Indeks ekonomske nejednakosti (GINI) Intervalna
frak Nivo etničke frakcionalizacije Ordinalna (kategorička)
vijek Prosječno trajanje životnog vijeka Intervalna
urban Udio urbanog stanovništva u populaciji Intervalna
nejed Nivo rodne nejednakosti Intervalna
oecd Da li je država članica OECD Ordinalna (kategorička)
nivodem Nivo demokratije Intervalna

Zadatak

  1. Učitati bazu podataka božović-jovana-III.xlsx u R.

  2. Rekodirati nedostajuće vrijednosti na svakoj varijabli.

  3. Izračunati Pirsonovu linearnu korelaciju između indeksa ekonomke nejednakosti (GINI) i rodne nejednakosti. Interpretirati rezultat.

  4. Grafički prikazati korelaciju između dvije varijable.

  5. Kreirati linearni model (OLS) koristeći indeks ekonomske nejednakosti (GINI) kao zavisnu varijablu, a rodnu nejednakost, prosječni životni vijek i procent urbane populacijekao nezavisne varijable.

    1. Interpretirati rezultate.

    2. Grafički prikazati odnos između indeksa ekonomke nejednakosti (GINI) i prosječnog životnog vijeka.

  6. Kreirati novi linearni model dodavanjem još dvije nezavisne varijable: nivo etničke frakcionalizacije i članstvo države u OECD.

    1. Obrazložiti način na koji je varijabla nivo etničke frakcionalizacije uključena u analizu?

    2. Interpretirati rezultate novog modela.

    3. Uporediti kvalitet i rezultate prvog i drugog modela.

  7. Kreirati logistički model na osnovu kojeg možemo izračunati uticaj prosječnog životnog vijeka, procenta (udjela) urbane populacije i rodne nejednakosti na nivo etničke frakcionalizacije.

    1. Interpretirati rezultate.

    2. Koji procent slučajeva je model tačno predvidio?

  8. Kreirati logistički model na osnovu kojeg možemo izračunati vjerovatnoću članstva države u OECD-u koristeći iste nezavisne varijable kao u slučaju prvog logističkog modela.

    1. Interpretiraj rezultate.

    2. Koji procent slučajeva je model tačno predvidio?

  9. Koristeći prvi logistički model izračunaj kolika je vjerovatnoća da će država etnički heterogena , sa procentom urbane populacije 75 , sa nivoom rodne nejednakosti 85 biti članica OECD-a. Interpretirati rezultat.

Instrukcije

  1. Rok za predaju domaćeg zadatka je 1.6.2026. u 13.00. Radove poslati na nbatricevic.fpn@gmail.com.

  2. Domaći zadatak dostaviti u Word formatu. Naziv fajla bi trebalo da prati format: Domaci_III_Božović_Jovana

  3. Fajl sa domaćim zadatkom trebalo bi da sadrži: kod, rezultat (output iz konzole) i interpretaciju.

Napomena: nepotpuni domaći zadaci neće biti pregledani.